Censusで共通利用出来るデータを定義出来る「Datasets」を試してみた
さがらです。
Censusには、Census内で共通利用できるデータを定義できる「Datasets」という機能があります。
Datasetsを定義すると、DestinationにSyncしたいデータとして使ったり、Segments機能でセグメントを定義する際のベースのデータにすることも出来ます。
Datasetsを定義
実際にDatasetsを定義してみます。
左のメニューから、Datasets
を押します。
右上の+ New Dataset
を押します。
どの方法でDatasetsを定義するか決めて、作成するDatasetsの名前をName
に入れます。dbtのModelやLookerやSigmaで集計された結果もDatasetsに定義できますが、今回は一番シンプルなSQL
を選択して進めます。
SQLエディターが表示されるので、Source
から使用するSourceを選択し、右側のエディター欄にクエリを記述します。
クエリを書いたら、画面下のShow preview
からクエリの実行結果を確認できます。問題なく記述したクエリが動くことを確認したら、右下のCreate and condigure
を押します。
次に、今回作成するDatasetsがどのタイプなのかを選択する必要があります。Person
、Event
などありますが、選択するタイプによって「ユーザーのメールアドレスを持つカラムはどれか」「イベントのタイムスタンプを持つカラムはどれか」など選択する必要があります。
今回は一番シンプルなGeneric
を選択します。Generic
の場合はUnique Id
を指定する必要があります。選択したら、右下のCreate dataset
を押します。
作成したDatasetsの確認
次に、作成したDatasetsがどのように見えるか、確認していきます。
Overview
タブでは、定義したSQLを確認したり、Descriptionを追加することが出来ます。
Columns
タブでは、各カラムの型を確認したり、PIIをチェックを入れることでカラムの値が表示されないようにしたり、Enumeratedにチェックを入れることでSegmentsを定義する際にフィルタの候補値を出せるようにしたり、ということが可能です。(詳細は公式ドキュメントも併せてご覧ください。)
Preview
タブでは、対象のデータをプレビュー表示することが出来ます。
Relationships
タブでは、別のDatasetsとのリレーションシップを定義することが出来ます。Segmentsを定義する際に複数のDatasetsを紐づけて定義できるようになります。(詳細は公式ドキュメントも併せてご覧ください。)
Syncs
タブでは、このDatasetsを用いたSyncの一覧が確認できます。
Segments
タブでは、このDatasetsを用いたSegmentsの一覧が確認できます。
Activity
タブでは、このDatasetsに対するイベントの履歴を見ることが出来ます。
最後に
Censusで共通利用出来るデータを定義出来る「Datasets」を試してみました。
Datasetsとして定義したうえでSyncやSegmentsの設定をすることで、各Datasetsごとの情報をまとめて1箇所で閲覧が出来るので、基本はDatasetsを定義した上でCensusを活用していくのが良さそうと感じました。
一方でSQLを用いてDatasetsを定義するとデータカオスの温床となるリスクがあると感じました。しかし、dbtのModelやLookerのLookをDatasetsとして定義できる機能があるので、これらのツールと紐づけるならばDatasetsを有効に使えると思います!